Mã hóa trong máy tính Katakana

Katakana có thể viết được trong tất cả các phông chữ dành cho tiếng Nhật và phông chữ đầy đủ của Unicode (như Arial Unicode MS), khá nhiều phông chữ hỗ trợ tiếng Trung Quốc cũng hỗ trợ cả katakana (như MS Song).

Katakana có hai định dạng mã hóa, halfwidth (độ rộng 1 nửa) hankaku (半角) và fullwidth (độ rộng đầy đủ) zenkaku (全角). Định dạng halfwidth có nguồn gốc từ JIS X 0201. Trong định dạng này, hầu hết các chữ katakana được biểu diễn bằng 1 byte. Cuối thập kỷ 1970, các ký tự 2 byte ra đời (như JIS X 0208) để viết chữ Hiragana, Kanji và các ký tự khác. Hệ thống JIS_X_0208 có cách biểu diễn chữ katakana hoàn toàn khác với JIS_X_0201. Chữ katakana của JIS_X_0208 được biểu diễn bằng ít nhất là 2 byte, vì thế nhiều thiết bị (đặc biệt là các thiết bị của thệ hệ trước) thường viết katakana có độ dài 2 byte. Đó là lý do tại sao chữ Katakana của JIS_X_0201 được gọi là halfwidth còn JIS_X_0208 là fullwidth. Và cũng do đó, hầu hết các định dạng mã hóa không có định dạng chữ Hiragana halfwidth.

Mặc dù hầu như không còn được dùng nữa, nhưng trong thực tế chữ katakana halfwidth vẫn còn trong nhiều hệ thống mã hóa. Ví dụ trong các máy điện toán, nhãn đĩa, phụ đề DVD hay truyền hình số. Nhiều kiểu mã hóa tiếng Nhật như EUC-JP, UnicodeShift-JIS vừa có cả mã katakana halfwidth vữa có cả mã fullwidth. Ngược lại, ISO-2022-JP lại không có mã katakana halfwidth, và thường được dùng trong các giao thức SMTPNNTP. Chữ halfwidth katakana thông thường được dùng để tiết kiệm bộ nhớ.

Mã Unicode

Trong Unicode, chữ fullwidth katakana chiếm các vị trí từ U+30A0 đến U+30FF :

Bảng Unicode Katakana
Official Unicode Consortium code chart Version 13.0
 0123456789ABCDEF
U+30Ax
U+30Bx
U+30Cx
U+30Dx
U+30Ex
U+30Fx
Phần mở rộng ngữ âm Katakana (Official Unicode Consortium code chart)
U+31Fx

Những chữ halfwidth katakana tương ứng cùng được mã hóa trong Unicode. Bắt đầu từ U+FF65 đến U+FF9F (các vị trí từ U+FF61 đến U+FF64 là các dấu câu halfwidth):

0123456789ABCDEF
FF6
FF7ソ
FF8
FF9

Các vị trí mã từ 32D0 đến 32FE là các chữ Katakana khoanh tròn. Chú ý: Không có chữ ン khoanh tròn.

0123456789ABCDEF
32D
32E
32F

Tài liệu tham khảo

WikiPedia: Katakana http://www.nihongoresources.com/language/lessons/l... http://www.realkana.com http://www.solosequenosenada.com/gramatica/japanes... http://www.geocities.jp/itikun01/hibi/zat2.html http://members.jcom.home.ne.jp/manya-isi/iroha.htm http://www.joyo96.org/96K/Lesson_1.html http://www.unicode.org/charts/PDF/U30A0.pdf http://www.users.pjwstk.edu.pl/~s4087/katakana.htm... https://www.unicode.org/charts/PDF/U1B000.pdf https://www.unicode.org/charts/PDF/U1B130.pdf